AI Dev室 ASPチーム
はじめに こんにちは、東北大学大学院 情報科学研究科 修士1年の清水怜央です。この度6週間の就業型インターンシップとしてAI Dev室ASPチームに所属し、タイトルにもあるような自然言語で話者性を操作できる音声合成モデルについての研究に取り組みました。 本記事では、その研究活動の内容について報告します。 音声と制御文の例 はじめに本研究で行なったことを簡単に知ってもらうために、提案法のモデルで合成した音声と話者性を制御するための文の例を示します。 制御文:「The speaker identity can be described as low-pitched, calm, slightly dark, very mature, cool, masculine.」訳:「話者性は低い音高で、落ち着いた、やや暗い、とても渋い、かっこいい、男性的と表現できます。」 制御文:「The speaker identity can be described as slightly refreshing, weak, slightly clear, slightly relaxed, very yo